小米(01810.HK) 0.000 (0.000%) 沽空 $13.64亿; 比率 28.971% 公开MiMo-V2.5系列模型的推理系统全链路优化方案。据小米方面介绍,团队围绕Hybrid SWA+MoE+多模态的覆合架构,系统性重构从KVCache管理、分级缓存、前缀缓存到调度策略与Prefill/Decode链路的完整推理栈,KVCache存储压缩至同级方案的约1/7,在长序列场景下推理成本大幅下降——这是本次降价的核心技术基础。
MiMO-V2.5实现KVCache双池+SWA-aware前缀树等五大核心突破,降价后仍能维持收支平衡。MiMo对开发者生态的投入持续加码。日前推出的百万亿Token创造者激励计划,总申请人数超过54万人,累计发放100万亿免费Token,折合超过6,500万元人民币。
相关内容《大行》富瑞降小米(01810.HK)目标价至26.98元 记忆体成本压力未见顶
五大核心突破包括KVCache双池+SWA-aware前缀树;GCache分布式缓存;KVCache亲和调度;Decode阶段MTP加速;多模态推理优化。
於5月27日,MiMo-V2.5系列API完成永久降价,最高降幅达99%,不区分输入长度。(jl/u)(港股报价延迟最少十五分钟。沽空资料截至 2026-06-01 16:25。)
AASTOCKS新闻